본문으로 건너뛰기

기초 통계량 확인

  1. 산술평균(Arithmetic Mean): 모든 값을 더한 후 개수로 나눈 값으로, 가장 흔히 사용되는 평균이다.

    • 장점: 모든 데이터를 반영하며 계산이 쉽다.
    • 단점: 극단값(이상치)에 민감하다.
  2. 중앙값(Median): 데이터를 크기순으로 정렬했을 때 정중앙에 위치한 값이다.

    • 장점: 극단값에 영향을 덜 받는다.
    • 단점: 데이터의 모든 값을 고려하지 않는다.
  3. 최빈값(Mode): 데이터에서 가장 자주 나타나는 값이다.

    • 장점: 범주형 데이터에 적합하다.
    • 단점: 여러 개의 최빈값이 존재할 수 있다.
  4. 기하평균(Geometric Mean): 모든 값을 곱한 후 데이터 개수만큼 제곱근을 취한 값이다.

    • 장점: 비율이나 성장률 계산에 유용하다.
    • 단점: 음수 값에는 적용할 수 없다.
  5. 조화평균(Harmonic Mean): 각 값의 역수를 취한 후 평균을 내고, 다시 역수를 취한 값이다.

    • 장점: 비율이나 속도의 평균 계산에 유용하다.
    • 단점: 0이나 음수 값에는 적용하기 어렵다.
  6. 가중평균(Weighted Mean): 각 값에 가중치를 부여하여 계산한 평균이다.

    • 장점: 중요도가 다른 데이터를 반영할 수 있다.
    • 단점: 적절한 가중치 설정이 필요하다.
  7. 절사평균(Trimmed Mean): 극단값을 일정 비율 제거한 후 계산한 평균이다.

    • 장점: 이상치의 영향을 줄일 수 있다.
    • 단점: 얼마나 절사할지 결정해야 한다.
  8. 윈저화 평균(Winsorized Mean): 극단값을 특정 백분위수 값으로 대체한 후 계산한 평균이다.

    • 장점: 이상치를 완전히 제거하지 않고 영향을 줄인다.
    • 단점: 윈저화 정도를 결정해야 한다.